开放词汇任务

首页

开放词汇任务

列表

默认

浏览次数

发布日期

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 848 浏览

开放词汇任务 首页 开放词汇任务

列表 默认 浏览次数 发布日期

SigLIP 2

开放词汇任务

首页

开放词汇任务

列表

默认

浏览次数

发布日期